查看原文
其他

神策数据桑文锋:我对“灵光一闪”没有兴趣|Xtecher人物特稿

2016-06-01 武悦 Xtecher

桑文锋,神策数据创始人兼CEO。前百度大数据部技术经理。



“外人听到的都是灵光一现的故事,殊不知背后耗费了多少功劳。”



 Xtecher原创 

 本文作者:武悦 
 网址:www.xtecher.com 

 微信公众号ID:Xtecher  

微信公众ID:Xtecher 


“这是你的梦想吗?”


“不,这是李彦宏的梦想。”


这段话说完,我和桑文锋都笑了。


这笑声背后,是一个八年故事的结束,也是下一段故事的开始。



 “八年一梦百度人” 


因一篇名为《百度,以问题的名义前行》的帖子,桑文锋被那股“问题驱动”的文化所吸引,07年从浙大硕士毕业的他,以工程师身份加入了百度。

08年开始,他为百度知道做“个性化推荐”——根据你平日搜索结果,推荐你感兴趣的问题,引导你去回答你可能擅长的问题。

这比业界的普遍脚步早了不少。

商业公司最早做个性化推荐的是06年的亚马逊,而中国个性化推荐真正火起来是2010年之后的事。淘宝推荐2011年左右开始做,当时还很简单粗暴,“许多人觉得,我买了什么你推什么,你不知道我已经买过了?”

个性化推荐不仅仅需要数据、技术和算法,还需要对问题本身的深刻理解。

彼时,桑文锋面临的也是他的数据事业的第一道考验。

“百度知道2005年开始,到了2008年,做了3年,想改变很难了。那时处于一种什么状态?回答量涨得很慢,没有爆发点。你看,许多人都知道百度知道,但是不会去登陆回答问题,我们怎么去引导这些人去回答?后来我们就想,从最近半年至少回答6个问题的用户入手,引导他们回答更多。于是我们训练模型,基于他们回答过的问题,推荐给他们更多可能感兴趣的……花了两个多月的时间,推上线,最后发现——没效果,用户回答量一点都没涨。这是什么原因?一个可能是,这些用户的确已经到极限了,不愿意回答更多了。怎么办?既然老用户榨不出来了,那就去拉更多新用户去答。于是,我们就做了个cookie推荐。虽然你没在百度知道上答过问题,但是我知道你在百度搜索里面搜索过什么词,你对什么感兴趣,那如果你一旦跳到百度知道,我就在旁边提醒你,这些你以前搜的东西,有相关的待解决问题……我们甚至当时做了一个实验,推荐叫‘等待您来回答’,还是‘我来帮忙解答’——这两个标题之间,前者的点击量比后者高了百分之十几。”

随着从老用户到新用户的扩张,桑文锋团队的触角,从产品内部,触碰到了整个百度用户,从35万核心用户,变成了几个亿用户。新的个性化推荐上线之后,他们立刻查看数据,发现回答量增加了7.5%——要知道,过去涨1%都很难很难了。

在桑文锋看来,解决问题的过程中,数据扮演了两个角色:一是用数据比较的结果去辅助决策,二是推荐算法本身依靠大量数据的采集和计算。

2009年,在百度第3年,他给自己定了个目标,“要让百度的数据团队和自然语言处理团队的地位一样重要”。而那时,桑文锋的数据团队,只有4人。

2014年,百度大数据部门成立,这个四人团队发展为如今员工过百的部门,他实现了百度用户日志大数据平台的从零到一。

战功赫赫,到了此时,他却不习惯了。

 

也许,他一开始就对“数据驱动”比“信息搜索”更感兴趣。他停下来,看着“百度的使命”,觉得失去了方向。


他问自己:“‘让人们平等便捷地获取信息找到所求’,这句话也是你的梦想吗?”

 

这一问,他的意识诚实起来:自己从来都没有这样的梦想,这是李彦宏的梦想。

曾经,桑文锋为离职的同事写过一句诗,“十年一觉扬州梦,八年一梦百度人。”如今这话也成了他自己的映照。

百度八年,2015年4月20日,他正式离开,创建神策数据。



 “达到未曾到达的边界” 


当我们从“百度期”聊到“创业期”时,桑文锋的状态嗨了起来。

他话锋一转,反守为攻:“你们说创新是什么?”

是灵光一现的时刻吗?是有如神助的启示吗?在桑文锋眼中,创新却一点不“神奇”。

他自己的答案是这样的:“我理解的创新,就是‘达到之前未曾到达的边界’。比如你以前没蹦极过,你现在成功蹦极了,这对你来说就是创新;你之前从来没有跑过超过20公里,现在跑了马拉松,这对你来说就是创新;再比如,你去非洲的一个小村庄,他那里之前没有手机,你把一个国产山寨机带过去,对他们这个村子来讲,这也是创新……这些都达到了某个不曾到达的边界。现在,当大部分公司盛行扯淡文化、流行拍脑袋决策的时候,我们在把大家向‘用数据决策’的方向上推进了一步——这就是我们的创新。”

此番理解,恰来自于一个不那么让人开心的故事。

2006年,桑文锋经历了一次灵感撞车。


那时还没有云计算,他想把一个机构内空闲的机器内存通过网络共享给繁忙机器做缓存,研究了两个月,才发现早在1996年就有个外国人做了类似的事。这让一向乐观的他有点绝望,悲观地想:自己是想不到任何新东西了。

这是来自一个工程师感性的悲伤。但追本溯源的本能欲望,让他开始从“是什么”走向“为什么”——他想知道,创新究竟从何而来。

“我会很好奇,这些人怎么就冒出了这么牛逼的想法。”他开始研究硅谷:Facebook、PayPal、Google是如何从第一天一步步演化为独角兽的。当然有时他也会走个神,想想牛顿是怎么研究出万有引力的。

“但你剖开之后才发现,‘灵感’是这些人一天到晚都在某个领域、十年如一日地坚持做一件事,才冒出来的。外人听到的都是灵光一现的故事,殊不知背后耗费了多少功劳。”

因此,他坦承,如今的自己对所谓的“灵光一闪”、“点子”、“idea”根本没那么大兴趣。


“什么是科学的方法?科学的方法无非就是这么几点:首先,你得定义一个问题,你要确定问题是什么;然后,你应该去研究一圈,看别人解决到什么程度了;然后,你再看看还有哪个关键点他没解决,你能不能围绕这个点子去解决得更好——这才是科学的方法。”

桑文锋笑说,一年之前自己肯定讲得不这么成体系,这一年的确想清楚了不少事。

“你不断地去思考,因为你就只干这一件事。睡觉前醒来后,反正清醒的时段里,都一直在想这些事。你会把许多东西理得更顺一些,一步步推导到本质,尤其当我们做的是to B的咨询+产品,必须要关心方法论。”



 “浪潮给了我机会” 


科技的发展不是均匀的,而是以浪潮的形式出现。对个人来讲,看清楚浪潮,赶上浪潮,便不枉此生。 


——这是吴军在浪潮之巅中的观点,用这话来形容桑文锋也很合适。

“2005年我研究生读的方向是网格计算,它提供的理念就是‘让计算资源像电力一样即插即用’,那时,我把相应的论文几乎都研究了一遍,我觉得这玩意太超前了,20年之后的事嘛——但2008年,云计算概念开始普及,我一看,这不就是网格计算的延伸吗?”

错过了云计算,却迎来了下一个浪潮:2012年,大数据开始兴起。

在他眼中,大数据的兴起原因无非三点:


一是移动互联网与传感器的发展,让更多人开始接触网络,“数据”量大大增多。包括我们的父辈,都开始数据化,照片、步数、心跳都成了数据;

二是数据采集计算能力的增强,这要感谢摩尔定律;

三是大数据意识的觉醒,概念炒了几年,人们开始相信数据了。

而自他进入百度起,做的可不就一直是大数据吗?

神策数据在2015年成立后,一年之内完成了两轮融资。前不久宣布拿到了A轮400万美金,红杉资本领投,天使轮投资方全部跟投。

何以如此顺利呢?


他的投资人这么开玩笑:“你养过猪吧?别人养都没养过,看都没看过。作为国内曾经最早做大数据的一批人,桑的团队有丰富的经验。”

 

那么,神策数据是依靠“技术”取胜的吗?

与很多工程师出身的创业者对技术神一般的信仰不同,桑文锋表示:“如果这个技术很炫,但解决不了问题,那我没兴趣做。”

“那么神策数据想要解决的是什么问题?”

“两件事:一是数据驱动决策,二是数据驱动产品。”

▼数据驱动决策


数据驱动决策,是向用户提供多维事件分析、漏斗转化、留存分析等。


“举个例子,一个用户在百度和优酷分别投了10万的广告,百度带来1000个客户,优酷带来500个。桑文锋说,很多大数据平台的分析就止于此了,但神策数据可以分析出从不同渠道而来的客户,哪个渠道客单价更高、留存更高等具体运营数据,且只需几秒钟。”

 

这样的优势得益于神策前期对数据源采集方案。

“我们的数据获取渠道有三种:一是将SDK嵌入服务中采集数据。二是可视化埋点,通过可视化的界面配置去取出来。三是后台导入数据。用户数据库里的数据,可以通过神策提供的数据导入工具,批量导入进来。”

 

这里需要提一下的是可视化埋点。

 

当然,一些竞品公司提出无需埋点技术,桑文锋认为,“无埋点技术未来这一定会打自己的脸。不埋点只能看到一些宏观的访问量、点击量,无法深入分析。真正在乎数据的公司为什么要省这个事呢?似乎这个技术只是适合那些看起来没什么野心的公司。”

 

另一方面,依托PaaS+SaaS模式,神策开始逐渐把数据生态的轮廓描摹清晰。


“与原有企业服务的SaaS平台不同,我们为用户提供私有化部署。也就是说神策数据只提供基础架构,平台数据仍部署在企业自己的服务器上,这样做虽然难度变大,但好处也显而易见,用户不再需要担心数据安全的问题。”


▼数据驱动产品

数据驱动产品也正是基于此。

 

“我们帮客户在底层把用户行为数据处理好并开放接口,在此基础上为数据再套上机器学习,或其他一些算法,回灌到产品中。让用户可以在此基础上进一步开发,挖掘数据的价值。”

 

“比如你给一家CRM系统的客服打电话解决问题,对方会问你手机号、订单号、订单状态、操作情况等一系列问题,来回15分钟过去了,还没开始解决问题。但是,通过神策的平台数据,客服在接到电话的一刻,通过用户ID抽取出用户行为,就掌握了基本情况,那问题可能2分钟就解决了。这就是数据驱动产品。”

 

“未来,数据分析的发展可能会从辅助人的工具,向自动化演化。比如一个to C的互联网产品,代金券发放是要每个人10块钱吗?那不一定。数据分析有些人他离开的可能性大,你就发给他15块钱,有些人处于模棱两可的状态,你发个1块钱给他,可能就回来了。”

 

换句话说,未来,大数据所传递的核心使命,就是去做出凭借人类大脑所认知的知识范畴无法做出的那种判断。”他给出了这个有点哲学意味又玄妙的判断。

“那么,你觉得大数据未来最终会发展到怎样的程度?”

“02年的时候,我第一次用Google,那时真的感觉这个搜索引擎挺牛逼的,但你很难想象它处于一个怎样的阶段,也不知道未来会如何发展。现在也是一样,要明确地说大数据它会发展到什么程度,其实是判断不清楚的,只能说和其他人相比,我更明白它如何运作而已。至于我做这件事,只能说是,浪潮给了我机会。”

这个有点朴实的答案恰是他真正的答案。


或许浪潮向来如此,如果站在一个比较高的角度来看历史,一切事物都遵循特定的轨迹,没有无缘无故的事情,也没有不合常理的发展。时代浪潮中的幸运儿们,其实都只是适合了那个时代的基本要求,这才得到了可能属于他们的光荣与梦想。



 心中的PayPal黑帮 


采访中,他很多次提到老东家百度。

“我现在不再coding了,但基本每天都会提很多产品bug。做10个60分的功能还是3个90分的功能?我选后者。这是百度文化对我的影响,best of the best,把事情做到极致。”

“我们现在做的,是帮助用户发掘出数据的价值,这和百度用数据说话不谋而合。”

“百度文化29条,我前段时间把它分成了5类:决策原则、做事原则、团队精神、人才、归属感……”

“神策刚成立的时候,大家问我公司制度,我告诉他们没有什么特别要求,都按百度的来。”

他说,他觉得自己带走了百度的一部分灵魂,神策数据的企业文化就基于百度文化的框架,提起学到的种种,他如数家珍,开玩笑地说:“我觉得我比李彦宏自己都熟悉百度文化。”

不过,在百度文化基础上,他同时进行了一些创新。这些创新很大程度上来源于他极其迷恋并深入研究的PayPal黑帮文化。


“是他们创造了硅谷……其实PayPal相关的东西,我差不多快研究遍了。”

他滔滔不绝列举起来:Peter Thiel、Max Levchin、Reid Hoffman、Elon Musk……他接着说,“我打算做一个全世界最全的PayPal黑帮目录。不只有你看到的这几个大佬,还有一些其他的小人物。我想我可以起码去写30个人吧。”

 

“为什么PayPal黑帮走出了这么多一流创业者?他们个个极度精英,一起扛过枪、打过炮、经历过挑战、经历过内斗,还有外部既得利益者对他们压制……但最后反而形成了更强的战斗力。”

 

他对团队的追求也是如此:当聪明、求知欲强、富有同情心而又目光敏锐的人们聚到一起,即使没有人教,他们也能互相学习,他们有机会创造出属于自己的理想王国。

因此,他要求各个部门都从业界最优秀的人身上学习。譬如当他希望加强团队销售能力时,他就专门从埃森哲请来咨询顾问给大家做培训。

当然,与PayPal不同的是,比起散作满天星的PayPal黑帮,他还是希望大家能够在一起聚集得更久。

 

“比起各自一摊,我更愿意看见我们形成一张网,每个人都有发挥的余地。不说这张网能左右中关村的发展,但我们现在都说我们的功能是全五道口最好的。(神策数据办公地点位于五道口清华同方科技园)”他哈哈大笑。

 

不过,我真的信了。

 

莎士比亚讲:“没有什么比希望不平凡而更加平凡的。”


每个人的心底都有着英雄主义情结,它就像庙宇里的不枯油灯,总有轻风经过,会让火焰升腾,并在墙上映出一个巨大而伟岸的身影。


 尾声 


“那如果让别人用一句话来描述自己,你希望听到什么?”


“乐观并有感染力。”

“不是技术大牛或者最酷工程师?”

“当然不,这不是我最认同的东西。我希望能用我的积极乐观感染身边的人。这是我人生三大使命之一。其实在2010年,我还想过一个事情。那时候不是有哈佛幸福课吗?我当时还想过做点什么,能让中国的幸福指数提升个0.1%之类的。”

“我人生的另一个使命是做成一件大事。”

创业以来,虽说瞄准了大数据,但模式到底是什么?桑文锋换了好几个方向。甚至最开始还试图用大数据做相亲活动,“事后我老婆都嘲笑说,你那个相亲活动网,一听就不靠谱,竟然还有人跟着你做。”

投资人也拿这个问他,为什么团队这么认定你?桑文锋的“追随者”给出了这样的回答:“我知道不管在任何时候,文锋都不可能坑我一把。”

“我人生第三个使命是追求内心的强大。”

他最看好的人是史玉柱这样在高潮跌落又能从低谷崛起的人。“其实我在去年11月、12月时压力是非常大的,虽然那时已拿到A轮offer,但整个资本市场行情并不太好,再加上正赶上竞争对手的宣传期,整个人特别焦虑,很容易发火。”

“后来回想压力来自于如何面对竞争。我用了两个月的时间想清楚了三点,一是有竞争才有市场,二是大数据的方向绝对是对的,三是我们是不是也在快步跑。”


如今,他显然学会了用更好的心态面对竞争。

他跑马拉松,时不时也朋友圈打个卡。

他笔耕不缀,在各个问答网站勤劳答题,一边练笔,一边分析各类网站带来的流量转化率。

他说他的写作完全是理性驱动,文字是他拿来做传播力的工具,“早期的时候,你只做产品也不行的,特别是做to B的创业,你要让更多的人知道。就比如大数据分析这块,可能也有些人技术比我好,但我可以写,可以让更多人知道这个领域,有更大的影响。”

另一方面,文字是他处理思路的方法。

“我受吴军影响,他写《浪潮之巅》,讲《数学之美》,说《文明之光》。我希望自己也能输出这样一些东西。”

他不停地写,不停地研究怎么写可以更好。

他称自己是“瓦利哥的机器岁月”,“我觉得我就是机器人生。当然我是码农里面看文学、历史类比较多的。对,我还是可以的。”

桑文锋的太太是中文系毕业的,他笑着说,自己现在一年写的文章数甚至超过了太太。为了将他心中的“PayPal黑帮”写清楚,他将《支付战争》那本书看了不下10遍,读书笔记做了超过3万字。

 

如今,桑文锋的女儿一岁多了,太太和岳父岳母都非常支持自己创业,“对奶粉钱没有提要求(笑)”。

他说起自己乡下出生,并没有对物质的过多欲望,一直以来,只有几件朴素的梦想:

一个梦想是在西湖的孤山上敲代码;

一个梦想是有一笔七位数的存款;

还有一个梦想是“做到买水果不看价格”。

“实现了吗?”

“都实现了。”

他笑了。

朴素的梦想早已实现,江湖的野心正适时开始。此刻行走在创业路上的他,无比轻装上阵。



关注本公众号(ID:Xtecher),后台回复 “神策数据” 或 “桑文锋” 或 “583”,可获得桑文锋项目的最新详情。



| 文末福利 |


本周五(6 月 3 日)21:00-22:00 ,

桑文锋会为Xtecher的粉丝朋友们进行 1 小时在线分享 Q&A:)

欢迎大家进群和桑文锋直接交流!



如果你对此感兴趣:
1. 关注本公众号 Xtecher(ID:Xtecher)

2. 转发本篇文章至朋友圈
3. 长按二维码进入本群,发送关注、转发两个截图,方可视为成功入群
4. 成功入群后,就可与桑文锋直接对话!






| 推荐阅读 | 点击文字直接跳转


精品文章

佳格数据张弓:从 NASA 走出的 “理性疯子”,他志在耕耘天地间

驭势科技吴甘沙:我的根本利益

线性资本张川:人要学会否定自己

Ping++ 金亦冶:所有你走过的捷径,总有一天都会再绕回来

王淮:冒险者的幸运牌

格灵深瞳赵勇:把未来一个齿轮一个齿轮地变成现实

孔淼:在我还不知道代码是什么的时候,我只想写诗

冯一村:此时此刻,给大数据一个注视

宋嘉伟:一个从容的创业者是如何思考

高欣欣:送创业项目一个里程碑事件

张诚:十年的北大研发路,只为这一款千兆芯片

袁行远:无论晴雨,步履不停

宋斯纯:历历万乡,不负每一场

戴若犁:越来越好奇,越来越好奇

李一帆:与其听风听雨,不如纵身一跃      



——小 X 爱彩蛋——


想知道下述摩斯电码的含义吗?

关注 Xtecher

回复 “我爱 Xtecher”

我们告诉你答案。

--. .-. . .- - -....- -- .. -. -.. ... -....- .... .- ...- . -....- .--. ..- .-. .--. --- ... . -....- --- - .... . .-. ... -....- .... .- ...- . -....- .-- .. ... .... . ... .-.-.- 


如果你拥有高精尖科技创业项目,Xtecher 将为你提供:

1. 专业的科技人物特稿和视频拍摄

2. 在 Xtecher 官网、APP、微信的全方位展示

3. 最专业的科技圈投资人、政府资源、产业资源

4. 创业企业品牌管家与 PR 服务

请关注本微信公众号:Xtecher,即可联系我们。


微信号:Xtecher


关注未来的人

都关注了 Xtecher




动动小手指,进入 Xtecher,查看神策数据 最新项目详情!

▼  ▼  ▼

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存